目录

练习1. 绘制水平柱状图 Profit by Sub-Category

导入数据文件'Sample - Superstore.xls',绘制水平柱状图,展示每个商品子类别(Sub-Category)的利润(Profit),并根据利润大小显示颜色。

练习2. 绘制堆积柱状图 Profit by Sub-Category & Segment

导入数据文件'Sample - Superstore.xls',使用堆积柱状图展示每个商品子类别(Sub-Category)中,不同细分客户(Segment)的利润(Profit)。

练习3. 绘制散点图 Sales and Profit Distrubution

导入数据文件'Sample - Superstore.xls',绘制散点图,展示商品子类别(Sub-Category)中'Paper'销售额(Sales)和利润(Profit)的相关关系,用气泡的颜色来展示Discount的取值大小,从而进一步分析这些变量之间的关系。

练习4. 绘制气泡图 Sales and Profit Distrubution

导入数据文件'Sample - Superstore.xls',绘制气泡图,展示销售额最高的前50名客户的销售额(X轴)和利润(Y轴)的关系,气泡的大小size和颜色color均体现折扣(Discount)这一变量,交互时增加显示的文本text:Customer Name和Discount(如交互所示)。

练习5. 绘制时间序列图 Sales and Profit by day

导入数据文件'Sample - Superstore.xls',绘制时间序列图,展示2018年每天的销售额(Sales)和利润(Profit)。

练习6. 绘制时间序列图 Sales and Profit by month

导入数据文件'Sample - Superstore.xls',绘制时间序列图,展示2018年每个月的销售额(Sales)和利润(Profit)。

对Order Date进行groupby操作后,时间戳是每天(D),如果想要将其转换为每月(M),可以通过重新采样来实现。重新采样是指将时间序列从一个频率转换为另一个频率的过程。将更高频率的数据聚合到低频率被称为向下采样,反之则称为向上采样。Pandas对象配有resample方法,与groupby方法类似,调用resample时需要对数据分组,之后再调用聚合函数。

练习7. 绘制饼图 Sales by Region

导入数据文件'Sample - Superstore.xls',绘制饼图,展示每个地区(Region)销售额(Sales)总和的占比情况。

练习8. 绘制多个饼图 Sales by Region

导入数据文件'Sample - Superstore.xls',绘制两个饼图,分别展示2015年和2018年每个地区(Region)销售额(Sales)总和的占比情况。

练习9. 绘制旭日图 Sales by Sub-Category

导入数据文件'Sample - Superstore.xls',绘制旭日图,展示商品类别(Category)和商品子类别(Sub-Category)之间的层级关系,环块的宽度体现销售额(Sales)总和。

练习10. 绘制层级图 Sales by Sub-Category

导入数据文件'Sample - Superstore.xls',绘制层级图,展示商品类别(Category)和商品子类别(Sub-Category)之间的层级关系,矩形版块的面积大小体现销售额(Sales)总和。

练习11. 绘制层级图 Sales and Profit by Region & States

导入数据文件'Sample - Superstore.xls',绘制层级图,展示地区(Region)和州(States)之间的层级,矩形板块的面积体现销售额(Sales)总和,矩形板块的颜色体现利润(Profit)总和。其中文本显示标签和销量全国百分比,交互时显示值和区域占比。